期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 面向维汉神经机器翻译的双向重排序模型分析
张新路, 李晓, 杨雅婷, 王磊, 董瑞
北京大学学报自然科学版    2020, 56 (1): 31-38.   DOI: 10.13209/j.0479-8023.2019.093
摘要1291)   HTML    PDF(pc) (899KB)(188)    收藏
在维吾尔语到汉语等低资源语料库上, 神经机器翻译的拟合训练容易陷入局部最优解, 导致单一模型的翻译结果可能不是全局最优解。针对此问题, 通过集成策略, 有效整合多个模型预测的概率分布, 将多个翻译模型作为一个整体; 同时采用基于交叉熵的重排序方法, 将具有相反解码方向的翻译模型相结合, 最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉平行语料上的实验结果表明, 与单一的Transformer模型相比, 改进后的方法提升4.82个BLEU值。
相关文章 | 多维度评价 | 评论0
2. 字符级的维吾尔语形态协同分析方法
吐尔洪·吾司曼, 杨雅婷, 艾孜孜·吐尔逊, 程力
北京大学学报自然科学版    2019, 55 (1): 47-54.   DOI: 10.13209/j.0479-8023.2018.067
摘要954)   HTML    PDF(pc) (1060KB)(228)    收藏

针对维吾尔语中构形词缀种类多、构形复杂以及发生音变现象等问题, 提出一种基于字符级的维吾尔语形态协同分析方法。该方法最大的特点是同时进行维吾尔语的形态切分、形态标注以及音变还原, 将词素边界、形态标记以及音变信息用一个复合标记描述, 采用字符序列的标注方法进行训练。实验结果显示, 形态切分、形态标注及音变还原的正确率分别达到96.39%, 92.78%和99.79%, 系统总体正确率达92.59%。

相关文章 | 多维度评价 | 评论0